乳腺癌是最常见的癌症,并寄存癌症的妇女的最多死亡人数。结合大规模筛查政策的诊断活动的最新进展显着降低了乳腺癌患者的死亡率。然而,病理学家手动检查病理学家的载玻片是麻烦的,耗时的,并且受到显着的和观察者内的变异性。最近,全幻灯片扫描系统的出现授权了病理幻灯片的快速数字化,并启用了开发数字工作流程。这些进步进一步使利用人工智能(AI)来协助,自动化和增强病理诊断。但是AI技术,尤其是深度学习(DL),需要大量的高质量注释数据来学习。构建此类任务特定的数据集造成了几个挑战,例如数据获取级别约束,耗时和昂贵的注释,以及私人信息的匿名化。在本文中,我们介绍了乳腺癌亚型(BRACS)DataSet,一个大队列的注释血清杂环蛋白和eosin(H&E) - 染色的图像,以促进乳房病变的表征。 BRACS包含547个全幻灯片图像(WSIS),并从WSI中提取4539个兴趣区域(ROI)。每个WSI和各自的ROI都是通过三个董事会认证的病理学家的共识注释为不同的病变类别。具体而言,Bracs包括三种病变类型,即良性,恶性和非典型,其进一步亚级分为七个类别。据我们所知,这是WSI和ROI水平的最大的乳腺癌亚型的附带数据集。此外,通过包括被升值的非典型病变,Bracs提供了利用AI更好地理解其特征的独特机会。
translated by 谷歌翻译
搜索排序的数据({\ BF SOSD},简而言之)是一种高度工程化的软件平台,用于基准获得学习索引,后者是通过将机器学习技术与经典组合在一起的方式搜索分类表的新颖且相当有效的提议算法。在这样的平台和相关的基准测试实验中,在自然和直观的选择之后,通过标准(教科书)二进制搜索过程执行最终搜索阶段。然而,最近的研究,不使用机器学习预测,表明统一的二进制搜索,简化以避免主循环中的\ vir {分支},在要搜索的表格中的标准对应物时,性能优异地是相对较小的,例如,在L1或L2缓存中拟合。 k-ary搜索的类似结果即使在大桌子上也是如此。人们期望学习索引中的类似行为。通过一组广泛的实验,与现有技术相干,我们表明,对于学习的索引,并且就{\ bf sosd}软件而言,使用标准例程(二进制或k-ary搜索)在所有内部存储器级别上优​​于均匀的一个。这一事实提供了到目前为止所制作的自然选择的定量理由。我们的实验还表明,统一的二进制和k-ary搜索可能是有利的,以便在学习索引中节省空间,同时授予良好的性能。我们的研究结果是对这种新颖和快速增长的区域的方法有关,以及有兴趣在应用领域中使用学习索引的从业者,例如数据库和搜索引擎。
translated by 谷歌翻译
机器学习技术,与数据结构合并,导致学习静态索引,创新和强大的工具,用于加速二进制搜索,使用其他空间相对于被搜索到的表。这种空间致力于ML模型。虽然在他们的阶段,但由于分类表搜索程序的普遍性,它们在方法上和实际上很重要。在现代应用中,模型空间是一个关键因素,实际上,关于该领域的一个重大开放问题是评估一个人在多大程度上享受学习索引的速度,同时使用常量或几乎恒定的空间模型。我们通过(a)在此处介绍两个新模型,即表示为{\ bf ko-bfs}和{\ bf sy-rmi}; (b)通过系统地探索现有模型的层次结构的时间空间权衡,即{\ bf sosd}中的{\ bf sosd}中的时间表。我们记录了一种新颖且复杂的时空折衷图片,这对用户来说非常丰富。我们通过实验表明{\ bf ko-bfs}可以加快恒定空间中的插值搜索和统一二进制搜索。对于其他版本的二进制搜索,我们的第二种模型以及双标准{\ BF PGM}索引可以实现速度,其模型空间比表所拍摄的0.05 \%$的型号。有竞争力在时间空间与现有建议的权衡方面。 {\ bf sy-rmi}和bi-criteria {\ bf pgm}在内部内存层次结构的各个级别中相互作用。最后,我们的调查结果对设计者感兴趣,因为它们强调了对学习指标中的时空关系的进一步研究的需要。
translated by 谷歌翻译